2025-11-10 · Google TPU v7 Ironwood + Apollo OCS 大规模部署

摘要（Takeaway）

Google TPU v7 Ironwood + Apollo OCS 完成 9216 chip SuperPod + 48 OCS 大规模落地，是 OCS 从 Spine 层进一步推进至 Scale-up 层（Pod 内立方体互联）的代际转折，标志着光路交换在 AI 算力集群骨干的地位被永久确立。
MEMS 微镜阵列 OCS（Palomar）整机 ~108W vs 同等端口 EPS ~3000W，节电 ~95%；对速率/调制透明意味着 800G→1.6T→3.2T 演进时"换模块不换骨干"，骨干代际折旧周期被拉长，光模块/光芯片成为代际升级的真正承担者。
2026 年 Google TPU 出货近 400 万颗 → 800G+ 光模块需求 >600 万只（TrendForce），叠加 800G+ 出货占比破 60%、1.6T 起量；A 股核心受益链条：中际旭创/新易盛（光模块）+ 凌云光/赛微电子（OCS 国产替代）+ 上游光芯片。

一、事件背景（Google OCS 历史与 Apollo 投入口径）

Apollo 是全球首个在数据中心规模量产部署的光路交换（OCS）系统，已经服役近十年，构成了 Google 数据中心的网络骨干。[Google 官方] [SemiAnalysis]

2025-11-06 至 11-10：Google 正式发布第七代 TPU "Ironwood"，宣布于 2025 年 11 月底全面可用，并首次完整披露与 Apollo OCS 深度协同的 9216-chip SuperPod 架构。[Google 官方] [HPCwire]
资本投入口径：市场流传"Apollo $3B 投入"说法，但权威渠道并未披露该确定数字；产业侧更一致的判断为 2026 年 Google OCS 网络侧支出约 $1.5–2.0B（与 BofA 预测的 $1.74B 接近），$3B 说法证据不足，建议采用区间情景。[内资研报] [外资研报]
历史代际：过去 5 年 Google 已"累计部署数万台 136×144 端口 OCS"，验证了 OCS 在生产环境的可靠性，2025 年的 TPU v7 是首次将 OCS 从 Spine 层进一步推到 Scale-up 层（Pod 内立方体互联）。[SemiAnalysis]

二、TPU v7 Ironwood 关键参数

单片规格：FP8 稠密算力 4.6 PFLOPS，BF16 2.307 PFLOPS；HBM3e 192 GB；带宽 7.2–7.4 TB/s；ICI 双向带宽 1.2 Tb/s；3nm（N3P/N3E）。[Google 官方] [内资研报]
SuperPod 规模：9216 片（144 个 4×4×4 立方体），共享 HBM 1.77 PB；FP8 峰值 >42.5 EFLOPS；可在 DCNI 层经 300×300 大端口 OCS×256 台扩展至 147,456 片单逻辑域。[The Register] [内资研报]
TCO 优势：内部测算 TPU v7 相对 GB200/GB300 的单位有效算力成本低 30–44%；MFU≈15% 即可盈亏平衡，而 GB300 需要约 30%。[内资研报] [第三方报告]
关于"v7 FP4 3.6 EF"的辨析：现有权威资料未给出 v7 的 FP4 口径；FP4 首次明确由 v8t/v8i 引入，应以 FP8 / SuperPod 42.5 EF 为准，避免代际配置混用。[内资研报]

三、Apollo OCS 技术深度

3.1 MEMS 微镜阵列工作原理

Apollo 内部代号 Palomar，核心是 MEMS 微镜封装：176 个独立可控 3D 微镜，因良率原因实际启用 136 个。[SemiAnalysis] [arXiv 2208.10041]
每面微镜可被独立电控偏转，将入射光束精确映射至输出光纤束的目标端口；对速率/调制格式完全透明，意味着 800G→1.6T→3.2T 演进时"换模块不换骨干"。[Google 官方]
单台 OCS 实现非阻塞 136×136（早期）/ 300×300（DCNI 层新代）/ 600 端口（TPU v7 SuperPod 假设代际）的全光交换。[内资研报] [SemiAnalysis]

3.2 单 OCS ~100W vs 传统电交换 ~3000W（功耗 -95%）

Palomar OCS 整机功耗约 108W，主要消耗在维持微镜位置；同等端口规模的 EPS（电交换）约 3000W，节电 ~95%。[SemiAnalysis] [DCD]
物理意义不止节能：省去 O/E/O 多次转换与多级包转发缓存，链路时延趋近 0；硬件代际寿命显著长于电交换芯片（不绑定 SerDes 速率），折旧友好。[内资研报]
Google 内部验证：脊层置换/直连架构下，吞吐 +30%、功耗 -40%、数据流完成时间 -10%、宕机时长 -50×、CapEx -30%。[arXiv 2208.10041]

3.3 Palomar（当前代）已"广泛部署"

累计部署 OCS 数量已达"数万台"量级；TPU v4/v5/v6 已使用 OCS 做 Spine 替换，TPU v7 是首次将 OCS 推进到 Scale-up 内立方体互联的代际。[SemiAnalysis] [内资研报]
Palomar 系统采用前后向兼容设计：与 Google 数据中心当前及未来使用的任意波长/带宽兼容，意味着同一台 OCS 可服务从 800G 到 1.6T、3.2T 多代光模块的接入，资本开支边际效率显著。[Google 官方]

3.4 OCS 路线图与技术路线分化

MEMS 路线（Google/Lumentum）：当前主流，端口密度高、插损可控、可靠性经过 10 年量产验证；瓶颈在 MEMS 微镜良率（Palomar 176 启用 136 即体现）。
液晶路线（Coherent）：插损更低、切换速度更快，但端口扩展性弱于 MEMS；NVIDIA 投资 Lumentum 与 Coherent，意味着 OCS 双路线并存格局延续。[内资研报]
压电陶瓷 DLBS（Polatis/凌云光）：低插损/低回波损耗优势明显，但端口扩展与装调复杂度限制大端口推广，适配差异化场景或冗余层应用。[内资研报]
硅光波导（iPronics 等）：集成度高、潜力可观，但插损/串扰仍需演进，短期内难成主流。[内资研报]

四、产业级影响

4.1 OCS 取代电交换（数据中心架构革命）

传统 Clos 架构以 EPS 为骨干，OCS 直接替换 Spine 层；TPU v7 进一步将 OCS 嵌入 Pod 内立方体互联，Scale-up 网络从铜缆+电交换走向"短铜+长光+全光交换"混合。[内资研报]
端口密度的两种版本并存（总端口共指向 ≈13,824）：
版本 A：48 台 144×144 OCS（早期稳定口径）。
版本 B：48 台 600 端口 OCS（由 144 立方体×96 光口/立方体均摊推导）。
差异反映工程实现与代际产品并行演进，单机 BOM 与供应商组合存在分化。[内资研报]

4.2 光路交换替代分组交换的趋势

OCS 对速率/调制透明意味着网络骨干代际折旧周期被显著拉长，而光模块/光芯片层成为代际升级的真正承担者。
跨 Pod 扩展使用 300×300 大端口 OCS×256 台聚合，构成上层"光路直连"骨干，分组交换被压缩到末端。[内资研报]

4.3 拉动 800G+ 光模块需求（近 4M TPU → 6M+ 模块）

TrendForce 等多家机构测算：2026 年 Google TPU 出货 近 400 万颗，对应 800G+ 光模块需求超 600 万只。[TrendForce] [内资研报]
全球 800G+ 光模块出货占比由 2024 年 19.5% → 2026 年 >60%；2025 年全球出货 2400 万只 → 2026 年跃升至接近 6300 万只（×2.6）。[TrendForce]
供给端：Innolight + Eoptolink 合计拿下 Google 80% 800G+ 订单；Lumentum 产能已排至 2028 年底，OCS 积压订单 >$400M**，2026Q4 收入预计 **>$100M。[TrendForce] [内资研报]

4.3.1 TPU v7 光模块需求分级配比（机架 → Pod → 集群）

网络层级	规模	光模块需求	配比
单机架	TPU v7 单机架	96 个光模块	1:1.5（单 chip 配 1.5 个）
单 Pod（SuperPod）	9,216 chip	13,824 个光模块	1:1.5（与机架保持一致）
跨 Pod 扩展（DCN）	147,456 TPU（147k 集群）	约 29.5 万个光模块	1:2（跨 Pod DCN 链路引入额外光化层）

关键解读：147k 集群相比单 Pod 配比从 1:1.5 升至 1:2（+33%），反映了 DCN 扩展层（跨 Pod）的光模块密度高于 Pod 内 OCS 互联——这是 Scale-up 全光化之外，Scale-across 跨集群互连的光模块拉动叠加层。[内资研报]

4.4 Scale-up 网络的全光化

TPU v7 在单 Pod 内通过 OCS 重构 X/Y/Z 三轴 3D Torus，是 Scale-up（节点内/Pod 内）走向全光化的标志性事件；NVIDIA NVLink 域当前仍以铜缆+电交换为主，分歧路径已经形成。
Anthropic 已签约最高 100 万颗 TPU v7（2026 年起），与 Google 的 Apollo OCS 架构深度绑定。[内资研报]
工程意义：单 Pod 内 OCS 切片可动态重构（数十毫秒级完成），实现热点流量跨立方体回避与故障域 Pod 内自愈；这是传统铜缆+电交换无法实现的"软光网络"能力。[arXiv 2208.10041]

4.5 上游光芯片/激光器的连锁拉动

TrendForce：AI 数据中心激光器短缺已经形成，NVIDIA 战略锁定全球激光器供应链；Google 近 4M TPU 落地将进一步加剧上游 EML/VCSEL 紧张。[TrendForce]
上游光芯片国产化路径打开：源杰科技、长光华芯、武汉敏芯等 EML/VCSEL 供应商在 800G/1.6T 浪潮中受益，但Google 链条对可靠性要求极高，国产化突破节奏需谨慎跟踪。

五、对 A 股的传导

公司	影响方向	关键观察点
凌云光 (688400)	压电 DLBS OCS / Polatis 代理（A 股 OCS 标杆之一）	国内交付落地节奏；端口扩展能力突破；非 Google 客户拓展（国内云厂商）
赛微电子 (300456)	MEMS 代工（瑞典 Silex），切入 MEMS-OCS 微镜阵列	北京亦庄产线 MEMS-OCS 量产验证；非 Google 客户首单兑现时间
中际旭创 (300308)	Google 800G/1.6T 光模块核心供应商（与 Innolight 协同）	TPU 配套份额；1.6T 放量节奏；硅光自给率
新易盛 (300502)	800G+ 光模块二供（Eoptolink）	Google 订单兑现；产能爬坡
光迅科技 (002281)	OCS 模块/光器件跟进	国产 OCS 整机突破；上游器件供给
华工科技 (000988)	MEMS 工艺布局	跟进微镜阵列工艺路线
英唐智控 (300131)	拟收购光隆集成切入 OCS 领域	收购落地与产品验证

现实约束：Google OCS 主供短期集中于 Lumentum（MEMS）+ Coherent（液晶），且客户对可靠性与算法控制栈耦合要求极高，新增主供短期难度大。本土厂商更现实的路径是上游关键器件、整机代工、非 Google 客户切入，逐步验证端口密度、插损、切换时间。[内资研报]

五点五、风险与不确定性

OCS 主供格局的"护城河"：Lumentum/Coherent 与 Google 的算法控制栈深度耦合（OCS 调度依赖 SDN 与 TPU 编排算法），新进入者短期内难以撼动主供地位；A 股标的更现实的路径是"非 Google 客户"+"上游器件"。
"$3B Apollo 投入"口径需谨慎：权威信源未确认；产业侧更可信的判断是 2026 年 OCS 网络侧支出 $1.5–2.0B，模型测算应采用区间情景而非单点假设。[内资研报]
OCS 端口密度并行版本：48×144 vs 48×600 工程实现差异影响单机 BOM 与厂商组合，需持续跟踪 Google 下一轮技术发布或实物图核实。[内资研报]
TPU 出货 4M 的兑现度：测算前提包括 TSMC N3P 产能、HBM3e 供给、Anthropic 等大客户落地节奏；任一环节延期都将影响下游光模块/OCS 弹性。
代际跳跃风险：CPO（共封装光学）与 OCS 是互补还是替代关系存在分歧；若 CPO 在 2027-2028 年快速放量，OCS 的"骨干价值"可能被部分稀释。[内资研报]

六、关键跟踪指标

Google 2026 TPU 实际出货量：是否达到/接近 400 万颗（决定光模块/OCS 弹性）。
800G+ 光模块出货占比：2026 年是否突破 60%（TrendForce 预测）；1.6T 占比起量节奏。
Lumentum OCS 营收：2026Q4 是否兑现 >$100M；积压订单是否突破 $500M（前为 $400M）。
A 股 OCS 玩家关键节点：
赛微电子 MEMS-OCS 北京亦庄产线试产 → 量产时间表
凌云光 DLBS OCS 国内云厂商首单（百度/阿里/腾讯）
英唐智控光隆集成收购完成与整合进度
OCS 端口密度版本：48×144 vs 48×600 哪种成为 Google 主流（决定单机 BOM 与厂商组合）。
TPU v8/v8i 节奏：FP4 引入是否进一步提升单 Pod 算力密度（拉动单 Pod 光端口数）。

七、横向比较：与 NVIDIA Scale-up 路线的分歧

维度	Google TPU v7 + Apollo OCS	NVIDIA GB200/GB300 NVLink
Scale-up 介质	光（OCS + 光模块）+ 短铜混合	主要为铜缆 + 电交换（NVL72/NVL576）
单 Pod 规模	9216 chip / 1.77 PB HBM	NVL72: 72 chip；NVL576 路线规划中
网络代际折旧	OCS 骨干长寿命（不绑定 SerDes 速率）	电交换芯片绑代际，折旧压力大
单位 TCO（内部口径）	较 GB200/GB300 低 30–44%	基线
光模块依赖度	极高（Pod 内+Pod 间均光化）	较低（铜缆为主，跨 Pod 光化）

路线分歧核心：Google 押注"全光骨干 + 透明速率演进"，NVIDIA 押注"高密度铜+电交换 + CPO 兜底"；A 股光模块/OCS 板块的最大边际利好来自 Google 路线的成功。[内资研报] [外资研报]

八、来源

[Google 官方] Google Cloud Blog: "Inside the Ironwood TPU codesigned AI stack" (2025-11)；"3 things to know about Ironwood, Google's latest TPU"；TPU7x Documentation
[SemiAnalysis] "Google OCS Apollo: The >$3 Billion Game-Changer in Datacenter Networking" (2023-03)；"Google TPUv7: The 900lb Gorilla In the Room" (2025-11)
[arXiv 2208.10041] Mission Apollo: Landing Optical Circuit Switching at Datacenter Scale
[HPCwire] "Google Aims to Flip the Script on AI Inference with New Ironwood TPUs" (2025-11-10)
[The Register] "TPU v7, Google's answer to Nvidia's Blackwell is nearly here" (2025-11-06)
[DCD] Datacenter Dynamics: "Mission Apollo: Behind Google's optical circuit switching revolution"
[TrendForce] "Google's High-Speed Interconnect Architecture to Push 800G+ Optical Transceiver Share Past 60% by 2026" (2026-02-10)；"Google Unveils 7^th-Gen TPU Ironwood with 9,216-Chip Superpod" (2025-11-07)
[内资研报] 通信行业投资策略：谷歌 TPU v7 与 OCS 光交换，架构革新与产业链机遇 (2026-02-13)；通信行业专题报告：数据中心互联技术专题 (2026-02-26)；互联网行业谷歌链专题：AI 全栈式创新 (2025-11-06)；中际旭创深度研究 (2026-04-22)；英唐智控首次覆盖报告 (2026-02-26)；凌云光业绩解读会路演纪要 (2026-04-29)
[外资研报] US Semiconductors and Hardware: Weekly Investor Pulse: Google TPUs & TSMC Technology Roadmap (2026-04-24)
[第三方报告] 2026 人工智能行业发展蓝皮书 (2026-04-26)；面向大规模智算集群场景的光互连技术白皮书 (2025-10-24)